播客推荐|阶跃星辰首席科学家谈推理模型
在2022年前后,张翔宇对当时计算机视觉(CV)领域的自监督学习范式产生了深刻的怀疑。他观察到,无论是contrastive learning还是MIM(Masked Image Modeling),虽然在小规模实验中表现优异,却普遍缺乏可扩展的scaling
在2022年前后,张翔宇对当时计算机视觉(CV)领域的自监督学习范式产生了深刻的怀疑。他观察到,无论是contrastive learning还是MIM(Masked Image Modeling),虽然在小规模实验中表现优异,却普遍缺乏可扩展的scaling
这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。
推理大模型中的注意力机制可以去掉吗?这是当下最具挑战性的开放问题之一。过去半年,伴随长思维链的爆火,模型在复杂推理任务中普遍需要生成成千上万的 tokens 才能产出高质量解答。然而,这也与 Transformer 架构天然矛盾:随着生成长度的增长,Atten
随着人工智能 (AI) 工具撼动了科学工作流程,Sam Rodriques 梦想着进行更系统的转型。他的初创公司 FutureHouse 位于加利福尼亚州旧金山,旨在培养一名“AI 科学家”,能够指挥从假设生成到纸张生产的整个研究管道。
近日,伊利诺伊大学香槟分校和加州大学伯克利分校的研究团队在arXiv预印本平台发表了一篇题为《ALPHAONE: Reasoning Models Thinking Slow and Fast at Test Time》的研究论文。该论文由Junyu Zhan
科技媒体 marktechpost 今天(5 月 27 日)发布博文,报道称微软研究院联合清华大学、北京大学组建团队,推出奖励推理模型(Reward Reasoning Models,RRMs),通过显式推理过程动态分配计算资源,提升复杂任务评估效果。
今年年初,DeepSeek-R1以低成本、高性能以及开源特性在全球AI圈内爆火走红,风头一度压过OpenAI,同时也开启了国产推理模型持续“狂飙”时刻。
5月14日,全球最大的大模型整合应用平台Poe发布数据显示,中国大模型公司深度求索的DeepSeek-R1模型使用率,已由2月的峰值下降了50%,但目前仍处于推理模型分类中的第三位。而快手团队的可灵(Kling系列)大模型,则在视频生成模型分类中迅速登顶,占据
5月14日,全球最大的大模型整合应用平台Poe发布数据显示,中国大模型公司深度求索的DeepSeek-R1模型使用率,已由2月的峰值下降了50%,但目前仍处于推理模型分类中的第三位。而快手团队的可灵(Kling系列)大模型,则在视频生成模型分类中迅速登顶,占据
近日,成都人形机器人创新中心实现重大突破:全国首发基于扩散架构的人形机器人高速推理模型R-DDIRM(Denoising Diffusion Implicit Robot Model),这是继成都人形机器人创新中心5月推出中国首个基于扩散架构人形机器人任务生成
昨天,DeepSeek 新推出 R1-Lite 推理模型的预览版本,使用强化学习训练,号称不仅媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。
今年早些时候,国内科技公司DeepSeek(深度求索)因V2模型一举成名,成名的原因简单粗暴,主打高性价比。在当时,DeepSeek V2的API定价约等于谷歌的七分之一,GPT-4 Turbo的七十分之一。